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(54) Title: METHOD FOR IDENTIFYING AND REPRESENTING 1NTERINDIVIDUAL DIFFERENCES OF DNA SEQUENCES 

(54) Bezeichnung: METHODE ZUR IDENTIFIZIERUNG UND DARSTELLUNG INTERINDIVIDUELLER 
DNA-SEQUENZUNTERSCHIEDE 

(57) Abstract 

The invention relates to a method for identifying and representing interindividual 
differences of DNA sequences. The invention is characterized in that; the genomic 
DNA of the individuals to be examined are isolated; segments of the genes to be 
compared, genomic regions, and genomes are defined; these segments are isolated 
in a targeted manner by means of PGR while using highly specific oligonucleotides 
and are produced in a sufficient number of copies; a simultaneous sequencing of ail 
obtained gene segments is carried out, said gene segments now being available as PCR 
products; afterwards, the mixture of termination reactions which is produced thereby 
and which contains the individual sequences of all gene segments is electrophoretically 
separated on a sequencing gel; the mixture is transferred onto a membrane by means 
of direct transfer electrophoresis; afterwards, the individual sequences of a determined 
gene segment from the original mixture are made visible by hybridizing the membrane 
with a marked, highly specific oligonucleotide; this process is repeated unit all gene 
segments from the common pool are detected; afterwards, interindividual differences 
of DNA sequences are detected by image analysis, and a genetic profile model is 
established and evaluated by mathematical processing. 

(57) Zusammenfassung 



Die Erfindung betrifft eine Methode zur Identifizierung und Darstellung interindi- 
vidueller DNA-Sequenzunterschiede. Sie ist dadurch gekennzeichnet, daB man die 
genomische DNA der zu untersuchenden lndividuen isoliert, Segmente der zu vergleichenden Gene, genomischen Regionen, Genome 
definiert, diese Segmente mittels PCR unter Verwendung hochspezifischer Oligonukleotide gezielt isoliert und in einer ausreichenden An- 
zahl von Kopien herstellt, eine simultane Sequenzierung aller gewonnenen Gensegmente, die nun als PCR-Produkte vorliegen, durchfUhrt, 
das dadurch entstehende Gemisch von Terminationsreaktionen, das die individuellen Sequenzen aller Gensegmente enthalt, anschliessend auf 
einem Sequenziergel elektrophoretisch trennt und mittels direkter Transferelektrophorese auf eine Membran ubertragt, anschliessend durch 
Hybridisierung der Membran mit einem markierten, hochspezifischen Oligonukleotid die individuellen Sequenzen eines bestimmten Genseg- 
mentes aus dem ursprunglichen Gemisch sichtbar macht, diesen Vorgang so oft wiederholt, bis alle Gensegmente aus dem ursprunglichen 
Pool detektiert sind, und anschliessend durch Image-Analyse interindividuelle DNA-Sequenzunterschiede detektiert, und durch mathema- 
tische Aufarbeitung ein Genprofilmuster erstellt und auswertet. 
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Methode zur Identifizierung und Darstellung interindividueller DNA- 
Sequenzunterschiede 

Die Erfindung betrifft eine Methode zur Identifizierung und Darstellung interindividueller 
DNA-Sequenzunterschiede. Anwendungsgebiete der Erfindung sind die Molekularbiologie, die 
Medizin, die Biologie die Veterinarmedizin, die Agrarwirtschaft und die Okobiologie. 

Nach der erstmaligen Sequenzierung eines menschlichen Referenzgenoms, die im Jahre 2005 
abgeschlossen sein wird, nach der Dokumentierung gesamtgenomischer Sequenzen 
verschiedenster Modellorganismen und Bakterien sowie der Sequenzierung aller Gene des 
Menschen und anderer Species wird die vergleichende Untersuchung individueller genetischer 
und genomischer Variabilitat einer der Schwerpunkte der nachsten Ara der Genomforschung 
('Postgenomics') werden. Sie stellt eine 'via regia' zur Erforschung von Gesamtgen- und 
Genomprofilen dar, die instrumentell fur die Identifizierung von Varianten bzw. 
Gensegmenten ist, die an der Pathogenese von Erkrankungen beteiligt sind, und die 
Variabilitat physiologischer und psychologischer Merkmale mitbedingen. Es ist deshalb 
entscheidend, zum gegenwartigen Zeitpunkt entsprechende methodische Ansatze zu 
entwickeln, die die vergleichende Sequenzierung mit geringerem Aufwand ermoglichen, und 
zugleich eine Ausgangsbasis fur die zukiinftige Entwicklung noch wesendich effizienterer 
Methoden schaffen. 

Der Erfindung liegt die Aufgabe zugrunde, eine Methode der vergleichenden Sequenzierung 
von DNA-Zielfragmenten als virtuelle Analyse-Einheiten von Genen und Genomen auf der 
Basis eines Multiplexing-Prinzipes zu entwickeln. 

Die Erfindung wird gemiiB den Anspriichen realisiert. 

Diese Erfindung stellt eine Form der 'targeted genome analysis' dar. Sie beruht auf dem 
Grundprinzip der von Church und Kieffer-Higgins beschriebenen 'Multiplex 
Sequenziermethode' (EP 303 459), das fur die de novo Sequenzierung genomischer Sequenzen 
ausgearbeitet ist. 

Die erfindungsgemaBe PCR-basierte Multiplex Sequenziermethode stellt jedoch konzeptionell 
und inhaltlich eine vollkommene Neuentwicklung dar (vgl. Abb. 1 und Abb. 1 b). Die 
erfindungsgemaBe Multipex-PCR-Sequenziermethode ist bingegen spezifisch fur die 
Identifizierung von Sequenzunterschieden in multiplen Kopien bekannter Sequenz konzipiert. 
Das Verfahren zur Klonselektion, -amplifikation und Tagging ist vollkommen neu entwickelt 
worden. Auch basiert die neue Methode nicht auf der Verwendung von Hybrid-DNA, die 
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unerlaBliche Grundlage des Church-Verfahrens ist. 

Die neue Methode konzentriert sich in dieser neudefinierten Form auf multiple, PCR- 
generierte Kopien von definierten genomischen Zielregionen-/Kandidatengensegmenten, deren 
simultane Sequenzierung in einem einzigen Sequenziervorgang stattfindet, auch die 
hochspezifische Detektienmg individueller Sequenzen ein- und desselben, definierten Segments 
aus einem Gemisch multipler Reaktionen/segmentspezifischer Sequenzen, und auf die 
Identifizierung interindividueller DNA-Sequenzunterschiede zwischen individuellen Genen 
durch Gruppierung basenspezifischer individueller Terminationsreaktionen und Detektion von 
Sequenzunterschieden unmittelbar durch visuelle Inspektion (vgl. Abb. 2). Eine hohe Qualitat 
der 'Images' und damit die Voraussetzung fur die Identifizierung von Sequenzunterschieden ist 
durch eine hohe Spezifitat der Oligonukleotide auf PCR-, Sequenzier-, und Detektionsebene 
gegeben. Der Gesamtvorgang der 'Multiplex PCR Sequenzierung' beinhaltet folgende 
methodische/technologische Segmente: 

Hervorzuheben sind als wesentliche Unterschiede zum EP-A- 303 459: 

Basis fur Multiplex-Sequenzierung ist nicht Hybrid-DNA, die ein beliebig fragmentiertes 
genomisches DNA-Fragment enthalt, sondern durch hochspezifische Oligonukleotide 
selektierte DNA-Zielfragmente; 'tags' sind nicht extern synthetisierte Oligos und Bestandteil 
des Vektors, ebenso sind 'sequencing primer hybridizing regions' nicht Bestandteil des 
Vektors, sondern integraler Bestandteil des genomischen Zielfragmentes; DNA 
Sequenzinterpretation durch Parallelisierung vielfacher individueller Terminationsreaktionen 
derselben Base zur unmittelbaren Identifizierung von DNA Sequenzunterschieden als 
zusatzliche und fehlende Banden mittels visueller Inspektion unmittelbar identifiziert werden 
(Abb. 2). 

a) Die Dissektion ('Zergliederung') eines Gens, Genoms, oder jeder genomischen Zielregion 
von Interesse in DNA-Segmente, die Templates fur die Amplifizierung mittels PCR 
darstellen. Unterschiedliche Ansatze zur Aufteilung in DNA-Segmente/PCR-Fragmente 
sind a) overlapping design (Abb. 3), b) staggered design (Abb.4), c) virtual dissection at 
the sequencing level (Abb. 5). Die Art der Zergliederung und damit der Multiplex-Faktor 
bzw. die Ausschopfung der Kapazitat der Methode steht in Zusammenhang mit der 
genomischen Organisation und Grofie des Gens, der Anzahl sich nichtiiberlappender 
Gensegmente und dem Umfang des geplanten Sequenziervorhabens (Anzahl der Gene bzw. 
Genome), sowie technischen Gesichtspunkten wie dem multifunktionalen Gebrauch von 
Oligonukleotiden als PCR-Primer, Sequenzierprimer, und 'Probes'. 

b) Die Amplifizierung multipler, N DNA-Segmente pro Individuum; diese kann separat fur 
jedes Segment stattfinden (oder z.B. durch Amplifizierung grofier Segmente, die mehrere 
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Sequenziersegmente, auch virtuelle Gensegmente genannt, beinhalten, vgl. Abb. 5), oder 
siraultan durch Multiplex PCR. Die Vereinigung multipler, N PCR-Produkte pro 
Individuum. Erzeugung multipler einstrangiger 'Templates' mittels irreversibler Biotin- 
Streptavidin-Kopplung unter Verwendung von 'magnetic beads' aus einem Gemisch von 
PCR-Produkten. Hier bestehen Modifikationsraoglichkeiten der Separierung der beiden 
DNA-Strange; es kdnnten auch biotinylierte Terminationsreaktionen magnetisch separiert 
werden. 

c) Die Reinigung jedes PCR-Produktes ist mdglich auf enzymatischem Wege, durch Saulen, 
Vakuumsysteme etc.; es kommen also unterschiedliche Reinigungsmethoden in Betracht. 

d) Die simultane Durchfuhrung von multiplen, N Sequenzierreaktionen mittels Einsatz 
multipler, N Sequenzierprimer unterschiedlicher Nukleotidkomposition, die jeweils 
hochspezifisch an ein bestimmtes genomisches Fragment binden. Im Falle daft per Design 
diesselbe DNA-Sequenz zwei benachbarten PCR-Fragmenten gemeinsam sein sollte (d.h. 
dafi der Sequenzierprimer zugleich an zwei benachbarte Fragmente binden konnte), wird 
die Konzentration der Sequenzierprimer verdoppelt (vgl. auch Abb. 3). Die Multiplex 
Sequenzierung erfolgt mittels der Dideoxy-Methode nach Sanger et al. (74 
Proc.Natl.Acad.Sci.USA 5463, 1977) unter Verwendung von T7/Mn fur die 
Sequenzierung einstrangiger DNA, bzw. Thermosequenase fur 'cycle sequencing', hier 
Detektion sowohl eines oder beider Strange; Alternative: multiplexing auf der Gelebene; 
Vereinigung individueller Sequenzierreaktionen, Auflosung der 
Tenninationsreaktionsgemische auf dem Gel; ebenso als Moglichkeit 'coupled 
amplification und genomic sequencing' zu integrieren. 

e) Die direkte Transferelektrophorese (DTE) der Gemische von Terminationsreaktionen auf 
einen festen Trager, eine Nylonmembran, mittels eines computer-gesteuerten Gradienten 
der Transfergeschwindigkeit, urn einen adaquaten Bandenabstand zur Detektion von 
Sequenzunterschieden zu erreichen. Fixierung der DNA an die Membran mittels UV-Licht 
durch Interkalation. 

f) Die sukzessive Detektion multipler individueller DNA-Sequenzen der jeweiligen PCR- 
Segmente mittels hochspezifischer Sonden, die mit 32P-ATP endmarkiert ist, oder 
Chemilumineszenz. Die dem Sequenzierprimer unmittelbar benachbarte Nukleotidsequenz 
dient als 'tag', als 'probe hybridizing region'; durch Nichtiiberlappung der 'tag' Sequenz 
mit der Seqenzierprimersequenz wird die Detektion unspezifischer Sequenz durch 
'misprinting' vermieden, und damit Hintergrundrauschen, das mit der Variantendetektion 
interferieren konnte. 

g) 'Image- Analyse durch 'Mustererkennung'. Ein spezifisches Ladeschema, welches die 
basenspezifischen Terminationsreaktionen von je 12 Individuen als Block gruppiert, konnen 
DNA-Sequenzunterschiede unmittelbar durch zusatzliche und/oder fehlende Banden 
identifiziert werden. 
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Methode zur Merkmals- und Risikodifferenzierung von genetischen Profilen auf DNA- 
Sequenzebene 

Die Methode dient zur Erarbeitung von spezifischen Genprofilmustern, die eine genetische 
Differenzierung fur das Risiko von Erkrankungen bzw. fur die Auspragung phanotypischer 
Merkmale jeder Art in jeder Species zulafit, aus einer groBen Menge von Sequenzdaten bzw. 
Sequenzvarianten (z.B. auch "single nucleotide polymorphisms"). Als Ausgangspunkt dienen 
entweder zwei Gruppen, bestehend aus Erkrankten und Gesunden, oder zwei beziiglich des 
untersuchten phanotypischen Merkmals differente Gruppen einer Species. Da beispielsweise 
die Varianten in DNA-Sequenzbereichen, die sowohl die regulierenden als auch die 
kodierenden Bereiche eines Kandidatengens umfassen, staustisch abhangig sind, werden die 
aus den Sequenzvarianten eines Gens Oder aus den Varianten verschiedener Gene und sonstiger 
genetischer Marker gebildeten Sequenzprofile in Form von Geno- und/oder Haplotypen 
simultan ausgewertet. Mit steigender Anzahl von Varianten ergibt sich bei maximaler 
Auflosung der Variability auf DNA-Sequenzebene eine in der Regel statistisch nicht mehr zur 
Vorhersage auswertbare grofie Anzahl von verschiedenen Geno- bzw. Haplotypen. Das 
Verfahren zielt auf die Reduktion der Anzahl dieser verschiedenen Geno- bzw. Haplotypen 
durch Bildung von Geno- oder Haplotypklassen nach unterschiedlichen Ahnlichkeitskriterien 
(Abstand der Geno- bzw. Haplotypen im n-dimensionalen Raum (bei n untersuchten 
Varianten), Anzahl und Art der Variantenaustausche zwischen den einzelnen Geno- bzw. 
Haplotypen, phylogenetischer Abstand etc.) mittels statistischer Klassifizierungs- oder Fuzzy- 
Methoden. Ausgehend von der Idee, dafl sich Geno- bzw. Haplotypen nicht unterscheiden 
lassen, wenn die Varianten fur die Differenzierung des untersuchten Merkmals bzw. Risikos 
irrelevant sind, wird zur Klassenbildung beispielsweise eine hierachische Clusteranalyse 
benutzt und die Veranderungen der Haufigkeitsverteilungen der Haplo- bzw. Genotypen der 
beiden differenten phanotypischen Gruppen hinsichtlich der Klasseneinteilung von einem 
Schritt zum anderen ausgenutzt. Schrittweise werden die jeweils ahnlichsten Geno- bzw. 
Haplotypen in Geno- bzw. Haplotypklassen zusammengefaBt. Jeder Schritt ist durch eine 
spezifische Fehlerquadratsumme, die sich aus den Abweichungen aller Variablenwerte zu den 
betreffenden Clustermittelwerten in alien Clustern ergibt, charakterisiert. Mittels eines % 2 - 
Testes wird in jedem Schritt uberpriift, ob sich die Haufigkeiten der Geno- bzw. Haplotypen in 
den auf der jeweiligen Stufe gebildeten Geno-bzw. Haplotypklassen zwischen den beiden zu 
untersuchenden Gruppen signifikant voneinander unterscheiden. Das Verfahren wird 
fortgefuhrt, bis alle Haplo- bzw. Genotypen in zwei Klassen zusammengefaBt worden sind. 
Unter Beriicksichtigung der schrittweisen Frequenzveranderungen werden die Schritte mit den 
groBten signifikanten Haplo- bzw. Genotypfrequenzunterschieden zwischen den beiden 
untersuchten Gruppen zur Klasseneinteilung der Haplo- bzw. Genotypen ausgenutzt. Durch 
Vergleich der in den Klassen zusammengefaBten Haplo- bzw. Genotypen (Consensusmuster 
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der Klassen) werden die fur das Merkmal Oder Risiko relevanten Varianten in Form von 
genetischen Consensusprofilen abgeleitet. Existiert kein Schritt mit signifikanten 
Frequenzunterschieden, so kann keine Aussage getroffen werden. 

Fiktives, einfaches Beispiel zur MerkmaJs- und Risikodifferenzierung von genetischen 
Profilen auf DNA-Sequenzebene mit 4 Varianten 

Gegeben seien 30 Personen, die an einer Erkrankung A leiden (Gruppe A der Erkrankten), 
und weitere 30 Personen, die keine Anzeichen fur Erkrankung A tragen (Gruppe G der 
Gesunden), wobei sich die Gruppen hinsichtlich anderer Merkmale nicht signifikant 
unterscheiden raogen. Von alien 60 Personen und deren Eltern seien die individuellen DNA- 
Sequenzen eines zu untersuchenden Kandidatengens beispielsweise mittels Multiplex- 
Sequenzierung bestimmt. An 4 verschiedenen Sequenzpositionen PI, P2, P3 und P4 moge eine 
Mutation auftreten. Es soil geklart werden, ob spezifische Haplorypprofile existieren, die mit 
der Krankheit assoziiert sind. 

Fiir jede Person aus den beiden Gruppen A und G seien die beiden individuellen 
Haplorypprofile, die durch die Angabe des Vorkommens der Mutation an PI, P2, P3 und P4 
bezuglich einer Referenzsequenz vollstandig bestimmt werden, gegeben. 
Es mogen unter alien 60 Personen die folgenden 6 verschiedenen Haplorypprofile existieren 
(l:Variante wie in der Referenzsequenz; 2:Variante tragt die jeweilige Mutation): 



Nummer des 


PI 


P2 


P3 


P4 


Haufigkeit in 


Haufigkeit in 


Haplotyps 










Gruppe A 


Gruppe G 


1 


1 


2 


1 


2 


7 


2 


2 


1 


1 


1 


1 


16 


18 


3 


2 


2 


2 


1 


11 


16 


4 


2 


2 


1 


2 


10 


3 


5 


1 


1 


1 


2 


4 


6 


6 


2 


1 


2 


1 


12 


15 



Zum besseren Verstandnis der jetzt folgenden Auswertung, die bezuglich der hierarchischen 
Clusteranalyse und der Auswertung von Kontingenztafeln mittels des kommerziellen 
Statistikprogramm-Paketes SPSS fur Windows NT, Version 7. 5 einschliefilich der EXACT- 
Module vorgenommen wurde, sind in der Anlage zum Beispiel Ausziige des Ausdrucks von 
SPSS enthalten. 
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Zur Prufung von Haufigkeitsunterschieden des Vorkommens dieser 6 verschiedenen 
Haplotypen (VAR00001 = Nummer des Haplotyps) in den Gruppen A (VAR0002=1) und G 
(VAR0002 =2) wurde ein x 2 -Test durchgefiihrt. Nach dem exakten Test (p=0,14) kann die 
Gleichheit der Verteilungen nicht abgelehnt werden. 

Zur Klassifizierung dieser 6 Haplotypen wird anschliefiend eine hierarchische Clusteranalyse 
durchgefuhrt. Als Distanzmafi wurde in diesem Beispiel die euklidische Distanz als einfachstes 
MaB benutzt. Die Ergebnisse sind in der Anlage enthalten. Im Schritt 1 werden aus den 6 
Haplotypen 3 Haplotypklassen gebildet, Klasse 1 aus Haplotypnummer 1 und 4, Klasse 2 aus 
den Haplotypen Nummer 2 und 5 sowie Klasse 3 aus 3 und 6. Im 2. und fur dieses Beispiel 
letzten Schritt werden Haplotypklasse 1 und 2 zusammengefafit. Die anschliefiende Prufung 
von Haufigkeitsunterschieden der verschiedenen Haplotypen in den Haplotypklassen des 1. 
Schrittes ergibt einen signifikanten Unterschied (p=0,017) zwischen der Gruppe der 
Erkrankten und der Gesunden. Im letzten Schritt ist kein signifikanter Unterschied zwischen 
den beiden neu entstandenen Haplotypklassen des 2. Schrittes, die durch Vereinigung der 
Haplotypklassen des 1. Schrittes entstanden sind, mehr zu beobachten. 



Aus den Haplotypklassen des 1 . Schrittes werden Consensusprofile abgeleitet: 



Haplotypklasse des 1. Schrittes 


Consensusprofil 




*212 


2 


111* 


3 


2*21 



Aus dem paarweisen Vergleich der Haufigkeiten der Consensusprofile geht hervor, daB das 
Consensusprofil *212 (*steht fur 1 oder 2) mit der Erkrankung A assoziiert ist. 
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Kontingenztabelle fur alle Haplotypen 



Count 





VAR 


30002 


Total 


1.00 


ZOO 


VAR00001 1,00 


7 


2 


9 


2,00 


16 


18 


34 


3.00 


11 


16 


27 


4,00 


10 


3 


13 


5,00 


4 


6 


10 


6,00 


12 


15 


27 


Total 


60 


60 


120 



Chi-Square Tests 





Value 


df 


Asymp. 

Sig. 
(2-sided) 


Exact Sig. 
(2-sided) 


Exact Sig. 
(1 -sided) 


Point 


Pearson 














Chi-Square 


8.324 a 


5 


.139 


,141 






Likelihood Ratio 


3,704 


5 


.121 


,140 






Fisher's Exact 


3,150 












Test 






,147 






Linear-by-Linear 














Association 


,532 b 


1 


,446 


,480 


.240 


,033 


N of Valid Cases 


120 













a. 2 cells (16,7%) have expected count less than 5. The minimum expected count is 4,50. 

b. The standardized statistic is ,763. 
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Clusteranalyse fur die Haplotypen 
Average Linkage (Between Groups) 



Agglomeration Schedule 





C!l 
Com 


ster 
jined 




Stage Cluster 
First ADoears 




Staae 


Cluster 
1 


Cluster 
2 


Coefficients 


Cluster 
1 


Cluster 
2 


Next 
Staae 


1 


3 


6 


1,000 


0 


0 


5 


2 


2 


5 


1.000 


0 


0 


4 


3 


1 


4 


1,000 


0 


0 


4 


4 


1 


2 


1,390 


3 


2 


5 


5 


1 


3 


1.720 


4 


1 


0 



HIERARCHICAL CLUSTER ANALYSIS 



Dendrogram using Average Linkage (Between Groups) 

Rescaied Distance Cluster Combine 

CASE 0 5 10 13 20 2S 
Label Nun * h < * + ~ 
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Kontingenaabelle «r dia Vartaiiung dar Happen in 3 Massan nach dam 1 . Sch* 





VAR< 


X3002 


Total 


1.00 


2.00 


VAROOOOl 1,00 
2,00 
3,00 

Total 


17 
20 
23 
60 


5 
24 
31 
60 


22 
44 
54 
120 



Chi- Square Tests 





Value 


df 


Asymp. 

Sig. 
(2-sided) 


Exact Sig. 
(2-sided) 


Exact Sig. 
(1 -sided) 


Point w 

Probability 


Pearson 














Chi-Square 


8,094* 


2 


.017 


,017 






Likelihood Ratio 


8,470 


2 


.014 


,017 






Fisher's Exact 


8.139 










Test 






,017 






Linear-by-Linear 






,015 








Association 


5,879 b 


1 


.021 


.010 


,005 


N of Valid Cases 


120 













a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11.00. 

b. The standardized statistic is 2,425. 
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Kontingenztabelle fur die Verteilung der Haplotypen in 2 Klassen nach dem 2. Schritt 



Count 





VAR( 


30002 


Total 


1.00 


2.00 


VAR00001 1,00 
3,00 

Total 


37 
23 

60 


29 
31 

60 


66 
54 

120 



Chi-Square Tests 





Value 


df 


Asymp. 

Sig. 
(2-sided) 


Exact Sig. 
(2-sided) 


Exact Sig. 
(1 -sided) 


Pearson 
Chi-Square 


2.155 6 


1 


.142 






Continuity 
Correction* 


1,650 


1 


.199 






Likelihood Ratio 
Fisher's Exact 
Test 


2,162 


1 


.141 


,199 


,099 


Linear-by-Linear 
Association 


2.137 


1 


.144 






N of Valid Cases 


120 











a. Computed only for a 2x2 table 

b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 27,00. 
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Die Erfindung kann im Wesen auch folgendermaBen beschrieben werden: 

1. Methode zur Verwendung eines Sets von Oligonukleotiden, die mit gesamtgenomischer 
DNA und DNA-Zielfragmenten hybridisieren, um damit zugleich die gezielte und simultane 
Generierung multipler individueller Sequenzen durch Amplification, Sequenzierung, und 
Dekodierung eines Pools von genomischen Sequenzen durcnzufunren. 

2. Eine Methode zur siraultanen Sequenzierung und Analyse von multiplen DNA- 
Zielfragmenten, die mittels PCR ampliflziert werden 

3. Eine Methode wie unter 2. beschrieben erweitert auf alle Nukleinsauren. 

4. Eine Methode zur Identifizierung interindividueller DNA Sequenzunterschiede in 
Kandidatengenen oder jeder genomischen Zielregion, die Erkrankungen ursachlich 
zugrundeliegen, genetisches Risiko fur eine Erkrankung tragen, oder mit interindividuell 
unterschiedlicher Ansprechbarkeit auf Medikamente, suchterzeugende Substanzen, oder 
endogene Liganden einhergehen. 

5. Eine Methode wie unter 4. beschrieben, erweitert auf Pflanzengenome, bakterielle Genome, 
grundsatzlich Genome aller Spezies, so daB in den Bereichen Molekularbiologie, Medizin, 
Biologie, Verterinarmedizin, Agrarwissenschaften und Okobiologie Aufschliisse iiber die 
Entstehung unterschiedlicher Merkmale auf der Basis genetischer Variationen gewonnen 
werden konnen. 

6. Eine Methode zur simultanen Generierung jedweder Nukleinsauresequenzen und deren 
Varationsanalyse. 

7. Ein spezifisches Verfahren zur Image-Generierung und Image-Analyse, die auf der Basis 
eines speziflschen Auftragsschemas der individuellen Terminationsrealetionen die unmittelbare 
Detektion von DNA Sequenzunterschieden, SNPs (single nucleotide polymorphisms), und 
Indel-Polymorphismen ermoglicht. Ein wesentliches Element der Images/Datenverwaltung 
liegt auch darin, daB Bandenmuster einer gegebenen Base eines definierten DNA-Segmentes 
als spezifisches Identifizierungsmuster fur jedes Nukleinsaure-Segment dient. 

8. Ein Verfahren, das es ermoglicht, DNA-Sequenzen multipler Individuen simultan in einem 
GefaB und in einem Vorgang durchzufuhren 

Im folgenden wird die Erfindung durch Ausfuhrungsbeispiele niiher erlautert: 

Die erfindungsgemafie Multiplex-Sequenziermethode wurde in einem 15-Plex- 
Sequenzierungsprojekt verwendet. In analoger Weise konnen auch 20-, 40- und 55-Plex- 
Sequenzierprojekte durchgefuhrt werden. 

Das Protokoll verwendet Mikrotiterplatten (96-wells) und Multichannel-Pipetten. 

Die gegenwartige modular aufgebaute Produktionslinie ist Mikrotiterplatten basiert und 

integriert 
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1. einen automatischen Pipettierroboter (Biomek 2000, Beckman); 

2. PCR-Automaten (MJ Research 3) 

3. ultradiinne Gel-Direkttransfer-Elektrophorese (DTE) 

4. semi-automatisierte parallele Hybridisierung 

5. einem Phosphor-Fluor-Imager (Molecular Dynamics) 

6. PCR-basierte Image-Analyse mittels 'skilled pattern interpretation' 



Gendissektion (Zergliederung), Primer-Design: 

PCR-Primer wurden nach dem 'staggered dissection' Prinzip ausgewahlt (vgl. Abb. lb) 
ausgewahlt. Sie erlauben die Amplifizierung mit einer annealing Temperatur von 60 oC. Es 
wurde das Programm Primerselect aus dem Dnastar-Paket verwendet. 



PCR: 

Fiir die vergleichende Sequenzierung des kodierenden und komplementaren Stranges wurden 
15 PCR-Fragmente pro Individuum (14 genspezifische und 1 HLA-Fragment zur Kontrolle fur 
den kodierenden Strang und 15 genspezifische fur den komplementaren Strang) einzeln in 
einem Perkin-Elmer 9600 oder MJ Research PCR-Automat amplifiziert. 
Die Reaktionen enthielten 100 ng genomische DNA, 10 mM TrisHCl (pH 8,3), 1,5 mM 
MgC12, 50 KC1, 200 /xM von jedem Nukleosid-Triphosphat, 30 pmol von jedem Primer, 3 U 
Taq-Polymerase, und Wasser in einem Endvolumen von 50 /d. Urn unspezifische Polymerase- 
Aktivitat zu verhindern, wurde die Taq-Polymerase in 5 pi Einmal-Reaktionspuffer-Gemisch ( 
10 mM TrisHCl (pH 8,3), 1,5 mM MgC12, 50 KC1), wahrend eines Zeitintervalls von 4 min 
bei 88 oC nachfolgend einer anfanglicben Denaturierung von 94 oC fur 4 min zugegeben. 
Reaktionsansatze wurden fur 30-35 Zyklen bei 94 oC (15 sec), 60 oC (15 sec) und 72 oC (30 
sec) oder bei 94 oC (15 sec), 60 oC (30 sec) und 72 oC (1 min) amplifiziert. 

Die Amplifizierung wurde mittels eines 5 pA Aliquots aus dem PCR-Ansatz auf einem 2 % 
Agarosegel uberpruft. 5'-biotinylierte Primer wurden als Antisense-Primer in dem 
beschriebenen PCR-Protokoll verwendet, da das Multiplexing-Protokoll auf der 
Einzelstrangsequenzierung mittels eines Festphasensystems basiert. Allen nachfolgend 
aufgefuhrten Schritten liegt eine Einheit von 24 oder einem vielfachen davon an DNA-Proben 
zugrunde, die einer oder mehreren Membranen/Images entspricht. 

Aufreinigung der PCR-Produkte: 

Alle 15PCR-Produkte pro Induvidium, 10 fil von jedem entsprechen ungefahr 200 ng 
amplifizierter PCR-DNA, wurden in einem Mikrotiter-Well zusammengefafit, welche letztlich 
mindestens 150 ^1 an PCR-Produkten enthielt. 24 x 4 15-Plex-Poole wurden anchliefiend iiber 
das 96-Well QIAvac manifold-System (Qiagen) aufgereinigt. Die aufgereinigten Pools an 
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PCR-Produkten wurden in einem Volumen von 60 /d 1 x TE im 96-well-Ma6stab eluiert. 

Fur die Festphasen-Multiplex-Sequenzierung des kodierenden Strangs wurde einzelstrangige 
(es) PCR-DNA mittels einer magnetischen Streptavidin/Biotin-Interaktion isoliert. Das 15- 
biotinylierte PCR-Produkt enthaltende Eluat wurde mit destilliertem Wasser auf ein 
Gesamtvolumen von 160 /d aufgefullt, mit einem gleicben Volumen an gewaschenen 
Magnetpartikeln versetzt, um ein Gemisch an einzelstangiger DNA-Matrizen fur die 
Sequenzierung herzustellen. Parallel dazu wurden die Magnetpartikel vorschriftsgemaB 
gewaschen (Dynal, Oslo). Das ursprungliche Protokoll wurde fur die simultane 
Immobilisierung der 15 verschiedenen PCR-Produkte dahingehend modifiziert , dafi nur 
ungefahr '4 ( 4 x anstelle 15 x) der vorgeschriebenen Menge an Magnetpartikeln verwendet 
wurde. 

ZusammengefaBt, 24 x 80 /d equivalent zu ca. 2 x 1 ml (800 ftg) an Streptavidin-beschichteten 
Magnetpartikeln wurden 2 x in einer gleichen Menge an 1 x Binde- und Wasch-(B & W) 
Puffer gewaschen, in dem doppeltem Volumen 2 x B & W-Puffer resuspendiert, und in 24 
Aliquots a 160 /d auf eine 96-Well-Platte verteilt. AnschlieBend wurden die 160 p\ an 
gepooltem und gereinigtem PCR-Produkten mit einem gleichen Volumen gewaschener 
Magentpartikel versetzt und fur 15 rain bei Raumteraperatur inkubiert. Das Aufschmelzen der 
DNA-Helices und die Trennung der DNA-Strange erfolgte vorschriftsmaBig; es wurden jedoch 
4-5-fache Volumina an Puffer und Losungen verwendet um die 15-fache Menge an 
prozessierter PCR-DNA auszugleichen. AnschlieBend wurden die Magnet-Partikel mit der an 
sie gebundenen esPCR-DNA in 60 /zl Wasser resuspendiert. 

Direkte Multiplex (15-plex)-Festphasen T7/Mn-didesoxy-Sequenzierung von esPCR-DNA: 
Die Multiplex-Sequenzierreaktionen wurden mit der doppelten Menge an Reagenzien, 
verglichen mit einer 15-fachen Menge an Reagenzien falls die Reaktionen einzeln prozessiert 
worden waren, durchgefuhrt, mit der Ausnahme einer veranderten Menge der 15 
verschiedenen Sequenzier-Primer. Die doppelte Menge, 2 pmol von jedem Sequenzierprimer 
wurden in einer Multiplex-Sequenzierreaktion verwendet. 

15-Plex-Primer : jedes in einem Mikrotiter-Well befindliche Gemisch aus 15 Matrizen wurde 
mit 2 ii\ Primercocktail (2 pmol von jedem Primer) und 4 pi 5 x Reaktionspuffer (75 raM 
NaCl, 40 mM TrisHCl, pH 7,5) versetzt. Die annealing-Gemische mit einem Gesamtvolumen 
von 22 nl wurden in einem Wasserbad 2 min bei 80 °C erhitzt und anschlieBend fur 20 min 
bei 37 °C inkubiert. Die Proben wurden kurz zentrifiigiert und auf Eis abgekiihlt. Vor dem 
Start der Sequenzierreaktion wurden 8 /*1 Mangan-DTT-Gemisch (25 mM DTT, 3,75 mM 
isocitric-Saure, 1,25 mM MnC12 in Wasser ), dem annealing-Gemisch zugesetzt, gefolgt durch 
die Zugabe von 4 pi verdiinnter Sequenase (0,5 U Sequenase fur 15 Matrizen und 0,03 U 
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IPPase in 1 x TE) in einem Endvolumen von 34 pi. Jeweils 7 p\ dieser Gemische wurden mit 
jeweils 5 pi eines basenspezifischen Nukleotid-Tenninationsgemisches (100 pM von jedem 
dNTP, 1 pM von jedem ddNTP, in 25 mM NaCl) versetzt und anschlieBend fur 15 min bei 37 
°C inkubiert. Nach erfolgter Sequenzierreaktion wurden dei 96-Well-Platten kurzzeitig 
zentrifugiert und die Uberstande durch magnetiscbe Abtrennung entfernt. Die 
Terminationsprodukte wurden eluiert, indem 5pl Stopp-Losung (95% Formamid, 20 mM 
EDTA, 0,05 % Bromphenol-Blau, 0,05 % Xylen-cyanol FF) zugegeben wurden und 
anschlieBend eine Erhitzung fur 2 min bei 80 °C erfolgte. Die Uberstande, die die Gemische 
der Sequenzierprodukte enthalten wurden erneut durch magnetische Trennung abgenommen, in 
eine neue Mikrotiterplatte uberfuhrt und bei -20 °C gelagert. Vor dem Auftragen wurden die 
Proben fur 2 min bei 80 °C in einem Wasserbad denaturiert und sofort auf Eis abgeschreckt. 
Fiir das Sequenziergel wurden von jeder Probe 1 pi aufgetragen. 

Direkte Multiplex (15-Plex) Cycle-Sequenzeirung von PCR-DNA: 

Fur die Sequenzierung des komplementaren Stranges wurde eine 15-Plex-Cycle-Sequenzierung 
mit 2 pi, entpsrechend ca. 40 ng von jedem PCR-Produkt, Thermo Sequenase, unter denen 
vom Hersteller vorgegebenenen Reaktionsbedingungen (Amersham) durchgefuhrt. Eine 
Ausnahme, der urspriingliche Sequenzier-Primer wurde durch eln Gemisch von 15 Primera 
(0,5 pmol/Primer) ersetzt. 

Direkte Transfer-Elektrophorese(DTE): 

96 Proben (entprechend den gepoolten Terminationsreaktionen von 24 Individuen), von jeder 1 
pi, wurden mit einer Hamilton- 12-Kanal-Pipette (Hamilton, Reno, NV) auf ein ultradiinnes, 
0,125 mm, 5 % Acrylamidgel aufgetragen, nach GroBe bei 3150 V aufgetrennt und nach dem 
Protokoll von Richterich und Church (1993) auf eine Nylonmembran (neutral), 1,2 pm 
Biodyne A, Pall, 32 x 45 cm ubertragen. Der Transfer erfolgte Computer gestiitzt mittels 
einem modifizierten Geschwindigkeitsgradienten von 1 1 cm/h fur 80 min und 8 cm/h fur 5 
Stunden, welches eine optimale Aufldsung der Sequenzierprodukte fur die Image- Analyse 
mittels visueller Inspektion erbrachte. Images, die eine direkte Identifizierung von 
Sequenzunterschieden verschiedener individueller Gene durch visuelle Inspektion ermoglichen, 
wurden durch die Einfuhrung eines spezifischen Ladeprinzips generiert. Die 
Terminationsreaktion eines Gemisches einer gegebenen Base G, T, A, C wurden in Blocken 
von jeweils 12 Individuen geladen, urn hierdurch die Detektion von Mutationen durch die 
Identifzierung von zusatzlichen undVoder fehlenden Banden (skilled pattern interpretation, vgl. 
Abb. la, lb und 2) zu erreichen. Nach dem Transfer wurde die DNA durch Bestrahlung mit 
UV-Licht fixiert. 
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Sequentielle Hybridisierung: 
Hybridisierungssonden wurden wie folgt hergestellt: 

Oligonukleotide mit einer Mindestlange von 18 Nukleotiden und revers komplementar zu dem 
Zielsegment, welches intergraler Bestandteil des genomischen Zielfragmentes ist, wurden in 
Protionen von 1 pi (2 pmol) mit [a- JI P]dATP (6000Ci/mmol; NEN) und 1 /d ( 14 U 
Kalbsthymus teminaler Desoxynukleotidyl-Transferase (USB) entsprechend den Vorgaben des 
Herstellers endmarkiert. Nach Vorhybridisierung bei 42 *C fiir mindestens 15 min, wurde eine 
10 /zl terminale Transferasereaktion mit 8 ml Hybridisierungspuffer ( 7 %SDS, 10 % 
Polyethylenglykol (PEG), 0,25 M NaCl, 0,051 % Phosphorsaure, 82 mM Na2HP04 x H20, 
10 mM EDTA, 32 mM NaOH; auch als Prahybridisierungslosung zu verwenden) verdiinnt, 
dem Volumen fur die Hybridisierung einer Membran. Ein bis zwei Membranen wurden in 
einer Glasrohre bei 42 ° C iiber Nacht, mindestens fur 4 h, hybridisert. Die Membranen 
wurden in Einheiten von 5 bei Raumtemperatur mittels eines Automaten fiir die 
Membranwaschung (Umwelt- und Ingenieurtechnik GmbH, Dresden) gewaschen, der 5 
Waschschritte mit jeweils 1500 ml Waschlosung (1 % SDS, 0,022 % Phosphorsaure, 69 mM 
Na2H2P04 x H20, 5 mM EDTA, 32 mM NAOH) durchfuhrte. Nachfolgend wurde jede der 
Membranen mit Klarsichtfolie bedeckt. Nach Exposition zu einem Molecular Dynamics 
Phosphor Fluor Imager Screen fur 1 bis 20 h wurde die radioaktive Probe mit Stripping-Puffer 
(0,2 % SDS, 2 mM EDTA, pH 8,3) fur 5 -10 min bei 65 °C mindestens 2 x, entfernt. Die 
Images wurden mittels eines Molecular Dynamics Phosphor Fluor Imagers eingelesen und die 
Images-Files fur die Genotypisierung auf einen PC transferiert. 



Protokolle: 

Im folgenden werden die Protokolle der Schritte des "Multiplex-PCR-Sequenzierungssystems" 
(Abb. 1) beschrieben, das fur die 15 Plex-Produktionssequenzierung in diesem Verfahren 
angewendet wurde. Die Protokolle basieren auf Mehrfachwells (96- Well-Format). Es wurden 
Mehrkanalpipetten verwendet. Die derzeitige modulare Produktionslinie basiert auf 
Mehrfachwells und schlieBt ein: 

1. einen Beckman Biomek 2000 Pipettierungsroboter, 

2. MJ Research Tetrads Thermozykler; 

3. eine ultradunne Geldirektiibertragungselektrophorese (DTE), 

4. eine halbautomatische parallele Probenuntersuchung, 

5. einen 'Molecular Dynamics'-Phosphor-Fluor-Imager und 

6. eine computergestutzte 'skilled pattern analysis' durch 'geschulte Mustererkennung'. 
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Genzerlegung, Primerdesign: PCR-Primer wurden nach dem 'versetzten' Zerlegungsmuster, 
das in Abb. 2 dargestellt wird, ausgewahlt, urn eine vollstandige und redundante Abdeckung 
der bekannten Gensequenz zu erreichen. Sie wurden so ausgewahlt, daB eine Amplification bei 
der gleichen Annealingtemperatur von 60°C ermoglicht wurde. Es wurde das 'PrimerSele'- 
Prograram des 'Dnastar'-Paketes angewendet. 

PCR-Verfahren: Urn die Kodierungs- und Komplementarstrange vergleichend zu sequenzieren, 
wurden 15 PCR-Produkte pro Einzelprobe (14 genspezifische und ein HLA-Fragment wurden 
als Kontrolle fur den Forwardstrang und 15 genspezifische Fragmente fur den Reversestrang 
hergestellt; separat in einem Perkin Elmer 9600 oder in MJ Research Tetrads amplifiziert. Die 
Reaktionsgemische enthielten 100 ng genomischer DNS, 10 mM Tris-HCl (pH 8,3), 1,5 mM 
MgClj, 50 mM KC1, 200 fiM jedes Nucleosidtriphosphates, 30 pmol jedes Primers, 3 U Taq- 
Polymerase (Boehringer Mannheim) und H 2 0 mit einem Endvolumen von je 50 id. Zur 
Vermeidung einer nichtspezifischen Enzymaktivitat wurde 7iz<?-Polymerase in einem Volumen 
von 5 id, das 1 x Reaktionspuffer (10 mM Tris-HCl (pH 8,3), 1,5 mM MgCl 2 , 50 mM KC1) 
enthielt, innerhalb eines Zeitintervalls von 4 Min. bei 88 °C nach einer 4-rniniitigen 
anfanglichen Denaturationsphase von 94 °C zugesetzt. Die Reaktionsgemische wurden 30-35 
Zyklen bei 94°C (15 Sek.), 60°C (15 Sek.) und 72°C (30 Sek.) bzw. bei 94'C (15 Sek.), 
60°C (30 Sek.) und 72°C (1 Min.) unterzogen. Die Amplifikation wurde kurz gepriift durch 
Auflosung von 5 fd PCR-Produkten auf einem 2%-igen Agarosegel und Sichtbarmachung der 
Banden mittels Ethidiumbromid und ultravioletter Bestrahlung. Gewohnlich wurde ausreichend 
PCR-DNS fur eine doppelte Sequenzanalyse erzeugt. Da sich die Multiplexprotokolle auf ein 
direktes Festphasensequenzierungsprotokoll stiitzten, das die Sequenzierung des 
Kodierungsstrangs gewahrleistete, wurden 5'biotinylierte Primer als Antisenseprimer im 
beschriebenen PCR-Protokoll eingefuhrt. Wahrend der fplgenden Schritte bildete eine Einheit 
von 24 einzelnen DNS-Proben oder ein Mehrfaches davon die Arbeitseinheiten, die einer oder 
einem Vielfachen einer Membran/eines Sequenzbildes ('Images') entsprechen. 

Reinigung der PCR-Produkte: Samdiche 15 PCR-Produkte eines Individuums, 10 id pro PCR- 
Produkt entsprechend etwa 200 ng PCR-DNS, wurden in ein Mikrotiterwell gepoolt, das somit 
etwa mindestens 150 id PCR-Produkte enthielt. 24 x 4 15-plex-Pools von PCR-Produkten 
wurden dann einer Reinigung durch das 96-Well-QIA vac-Mehrfachsystem (Qiagen) 
unterzogen. Die Pools der PCR-Produkte wurden mit 50 id von 1 x TE-Puffer in ein 96-Well- 
Format eluiert. Fiir die auf einer Festphasen-Sequenzierung basierenden 
Multiplexsequenzierung des Kodierungsstranges wurde einzelstrangige PCR-DNS durch die 
Interaktion von Streptavidin auf magnetischen 'Beads' mit Biotin abgetrennt. Das eluierte 
Produktvolumen, das 15 biotinylierte PCR-Produkte enthalt, wurde mit destilliertem HjO auf 
ein Endvolumen von 160 jtl aufgefullt, urn mit einer gleichen Menge gewaschener 
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magnetischer 'Beads' zusammengebracht zu werden, urn die gepoolten PCR-Produkte zu 
immobilisieren und Gemische einzelstrangiger DNS als Sequenzierraatrizen herzustellen. 
Parallel dazu waren die 'Beads', gemaB den Erapfehlungen des Herstellers (Dynal, Oslo), 
gewaschen worden. Das Protokoll des Herstellers war modifiziert worden, um die 
gleichzeitige Immobilisierung von 15 verschiedenen PCR-Produkten zu ermoglichen, wobei 
etwa our '4 (4x anstatt 15x) der erf order lichen/empfohlenen Menge an 'Beads' verwendet 
wurde. Kurz gesagt, 24 x 80 pi, was etwa 2 x 1 ml (800 fig) mit Streptavidin uberzogenen 
raagnetischen 'Beads' aquivalent ist, wurden zwei Mai in entsprechenden Volumina von 1 x 
Binde- und Waschpuffer gewaschen, erneut in dem doppelten Volumen von 2x Binde- und 
Waschpuffer suspendiert, und in 24 Aliquoten von 160 til auf einer 96-Well-Platte verteilt. 
Dann wurden die gepoolten, gereinigten PCR-Produkte in einem Endvolumen von 160 /d mit 
gleichen Volumina von vorgewaschenen 'Beads' versetzt und 15 Min. bei Zimmertemperatur 
inkubiert. Das Schmelzen der DNS-Doppelstrangmolekiile und die Abtrennung der DNS- 
Strange erfolgten gemaB dem Herstellerprotokoll. Eine vier- bis funffache Menge von Puffern 
und Lbsungen wurde jedoch fur die Akkomodierung der 15-fachen Menge behandelter PCR- 
DNS verbraucht. Nach AbschluB der Behandlung wurden die Perlen mit gebundener 
einzelstrangiger PCR-DNS in 16 fi\ H 2 0 erneut suspendiert. 

Direkte Festphasen-Multiplex (15-plex)-T7IMn-Dideoxy-Sequenzierung einzelstrangiger PCR- 
DNS: Multiplex-Sequenzierungsreaktionen wurden mit einer doppelten Menge von Reagenzien 
durchgefuhrt verglichen mit der 15-fachen Menge von Reagenzien, die erforderlich ware, 
wenn die Reaktionen einzeln durchgefuhrt worden waren, ausgenommen die Mengen der 15 
verschiedenen Sequenzierungsprimer. Die doppelte Menge (2 pmol) jedes 
Sequenzierungsprimers wurde in einer Multiplex-Sequenzierungsreaktion eingesetzt, um dem 
Annealing der Primer an beide, das Ziel- und das Nachbarfragment, begegnen zu konnen; 
siehe auch Abb. 2. 15-Plex-Primer- Annealing: Jeder Pool von 15 Matrizen, die in einem 
Mikrotiterwell enthalten waren, wurden mit 2 /xl eines Primercocktails (2 pmol jedes Primers) 
und 4 nl von 5 Reaktionspuffer (75 mM NaCl, 40 mM Tris-HCl, pH 7,5) gemischt. Diese 
Annealinggemische von einem gesamten Reaktionsvolumen von 22 *il wurden 2 Min. lang in 
einem Wasserbad von 80°C erhitzt und 20 Min. lang bei 37°C inkubiert. Die Proben wurden 
kurz zentrifugiert und auf Eis gekuhlt. Bevor die Sequenzierungsreaktionen eingeleitet wurden, 
wurden dem jeweiligen Annealinggemisch 8 id eines Mangan-DTT-Gemisches (25 mM DTT, 
3,75 mM Iso-Zitronensaure, 1,25 mM MnClj in H 2 0) zugesetzt, gefolgt von 4 /tl Sequenase- 
Losung (0,5 U Sequenase fur 15 Matrizen und 0,03 U IPPase in 1 x TE), was ein Endvolumen 
von 34 y\ ergab. 7 p\ dieser Gemische wurden in 5 ttl basenspezifische Nukleotidgemische 
(100 fiM jedes dNTP: 1 /xM jedes ddNTP, in 25 mM NaCl) aliquotiert und 15 Min. bei 37°C 
inkubiert. Nachdem die Extension beendet war, wurde die 96-Well-Platte kurz zentrifugiert, 
die iiberstehende Fliissigkeit wurde mittels magnetischer Trennung entfernt; die 
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Terminationsprodukte wurden durch Zusatz von 5 pi Stopplosung (95 % Formamid, 20 mM 
EDTA, 0,05 % Bromphenolblau, 0,05 % Xylenzyanol FF) und eine 2-minutige Erhitzung auf 
80° C eluiert. Die Gberstehende Flussigkeit, die die Pools der terminierten 
Sequenzierungsreaktionen enthalt, wurde mittels magnetischer Trennung entfernt und auf eine 
neue Mikrotiterplatte aufgetragen und bei -20°C gelagert. Unmittelbar vor dem Aufbringen 
wurden die Proben 2 Min. lang in einem Wasserbad von 80 °C denaturiert und schnell gekiihlt 
auf Eis/Wasser, 1 /d pro Probe wurde auf das Sequenzierungsgel aufgebracht. 

Direkte Multiplex (15-plex)- 'Cycle' Sequenzierung von PCR-DNS 

Die Komplementarstrangsequenzierung erfolgte mit einer 15-plex-'Cycle'-Sequenzierung bei 
Verwendung von 2 pi des jeweiligen PCR-Produktes, was etwa 40 ng aquivalent ist, 
Thermosequena.se und Anwendung der durch den Lieferanten (Amersham) beschriebenen 
Reaktionsbedingungen, mit der Ausnahme, daB der Sequenzierungsprimer durch ein Gemisch 
von 15 Primern, 0,5 pmol pro Primer, ersetzt wurde. So wurden 15 Sequenzierungsreaktionen 
durchgefuhrt mit der einfachen Menge der Reagenzien, was einem Funfzehntel der 
Reagenzien, die fur die Standardreaktionen verwendet wurden, entspricht. 

DirekObertragungselektrophorese (DTE): 96 Proben (die den gepoolten basenspezifischen 
Terminationsreaktionen von 24 Individuen entsprachen), je lpl, wurden mit einer 12-kanaligen 
Hamilton-Pipette (Hamilton, Reno, NV) auf ein ultradiinnes, 0,125 mm, 5 %-iges 
Akrylamidgel aufgebracht, aufgelost nach der GrolJe bei 3150 V und auf eine Nylonmembran 
(neutral 1,2 pm Biodyne A, Pall, GrdBe: 32 x 45 cm) durch DTE aufgebracht, wie im 
einzelnen von Richterich und Church (1993) beschrieben wurde. Die Ubertragung war 
computergesteuert und folgte einem modifizierten Geschwindigkeitsgradienten von 1 1 cm/Std 
fur 80 Min., und von 8 cm/Std. fur 5 Stunden, was fur gleichmaiiige Abstande zwischen den 
Banden von etwa 0,8 mm, optimal fur eine Bildanalyse durch visuelle Priifung, sorgte. Die 
'Sequenzimages', die eine Identifizierung der Sequenzunterschiede zwischen den individuellen 
Genen unmittelbar durch visuelle Priifung ermoglichen, wurden durch Einfuhrung eines 
spezifischen Ladesystems erzeugt: die Terminationsreaktionspools einer gegebenen Base- G, 
T, A, C wurden in Blocks von je 12 Individuen geladen, um die Identifizierung von Varianten 
durch Feststellung zusatzlicher und/oder fehlender Banden zu erleichtern ('Skilled Pattern 
Interpretation'-geschulte Mustererkennung). Nach der Ubertragung der DNS-Formen von den 
Gelen auf die Nylonmembranen wurden sie 30 Sekunden lang durch ultraviolettes Licht 
vernetzt. 

Sequentielle Hybridisierung: Die 'Proben' wurden wie folgt heTgestellt: 

Oligonucleotide, mindestens 18 nt lang, und reverskomplementar zu den 'Tag'-Sequenzen, die 
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Bestandteil der genomischen Zielsegmente sind (siehe Abb. 2), wurden durch Zusatz von etwa 
15 dAMP-Resten aus 2,6 jd [a - M P] dATP (6000 Ci/mraol; NEN) in Portionen von 1 /d 
(2pmol) markiert mit 1 /d (14 U) Kalbsthymusdrusenterminal-deoxy nucleotidyltransferase 
(USB) gemaB den Herstellererapfehlungen. Nach einera Prahybridisierungsschritt von 
mindestens 15 Min. bei 42 °C wurde eine 10 /xl Terrainaltransferasereaktion in 8 ml 
Hybridisierungspuffer [7 % SDS, 10 % Polyathylenglykol (PEG), 0,25 M NaCl, 0,051 % 
H,P0 4 , 82 mM NajHP0 4 x H 2 0, 10 mM EDTA (freie Saure), 32 mM NaOH; auch fur die 
Prahybridisierung verwendet], dem berechneten Volumen fur die Hybridisierung einer 
Membran, verdunnt. Gewohnlich wurden 1 bis 2 Membranen in ein Glasrohr (Container) 
eingebracht und iiber Nacht, zumindest 4 Stunden lang, bei 42°C hybridisiert. Die Membranen 
wurden in Gruppen von 5 bei Zimmertemperatur unter Einsatz eines automatisierten Gerates 
fur die Blotinkubation und das Waschen (Umwelt- und Ingenieurtechnik GmbH, Dresden), 
programmiert fur 5 Waschschritte mit 1800 ml Puffer, der 1 % SDS, 0,022 % H,P0 4 , 69 mM 
Na 2 H 2 P0 4 x H 2 0, 5 mM EDTA (freie Saure), 32 mM NaOH enthalt, gewaschen. Jede der 
feuchten Membranen wurde zwischen eine Saran-Hulle und eine Polyesterunterlage gelegt. 
Nach Exposition in einem 'Molecular Dynamics'-Phosphor-Fluor- Imager bei 
Zimmertemperatur 1 bis 20 Stunden lang, wurden die radioaktiven Sonden mit 0,2 % SDS und 
2 mM EDTA (freie Saure, eingestellt auf einen pH von 8,3 mit einer tris-Lauge) mindestens 
zweimal 5 bis 10 Min. lang bei 65 °C entfernt. Wahrend der 15 Hybridisierungen waren die 
Auflosung und das Verhaltnis Signal zum Hintergrund im wesentiichen die gleichen, wie sie 
mit dem optimieiten Uniplex-Verfahren erzielt wurden und damit war die Bildqualitat, die fur 
die Identifizierung von Sequenzvarianten mit hoher Genauigkeit wiinschenswert ist, garantiert. 
Die Sequenzbilder wurden eingescannt und die Bilddateien wurden auf Computer ubertragen 
fur das Lesen der Genotypen. 



Ergebnis: 

Vergleichende Sequenzanalyse des humanen /i-Opioid-Rezepiorgens 

Das humane /t-Opioid-Rezeptorgen inklusive seiner 5'-regulierenden, kodierenden und 
wichtiger intronischer Sequenzen wurde in 250 Individuen vergleichend sequenziert. Die 
Gruppe der 250 untersuchten Individuen beinhaltete Suchtige mit einer Familiengeschichte, der 
Krankheit und Kontrollen. Insgesamt wurden 1,7 Mbasen analysiert. Die Analyse der Daten 
zeigte, daB eine spezifische Konstellation von Polymorphismen (Haplotyp) mit einer 
signifikant erhohten Frequenz in Individuen mit einer genetischen Disposition zu 
Drogenmifibrauch beobachtet wurde. das Projekt die folgenden Schritte: 
a) Klonierung der 5'-regulierenden und wichtiger intronischer Sequenzen, welches die vorher 
bekannte cDNA-Sequenzinformation (2162bp) auf insgesamt 6968 bp erweiterte, 
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b) Dissektion (Zergliederung) der gesamten genomischen Sequenz sowohl des kodierenden als 
auch des koraplementaren Stranges in PCR-Fragmente, 15-Plex-Sequenzierung beider Strange. 
Generierung von zwei Satzen all Membranen, die pro Strang 1,7 Mbasen an vergleichender 
Sequenzinfomation enthalten, 15 Hybridisierungszyklen pro Membran, Auswertung von ca. 
330 Images fiber 'skilled pattern analysis' 

c) Detenninierung des gesamten polymorphen Spektrums mit insgesamt 37 Varianten, 
Haplotyp-Analyse von 23 Varianten resultierend in zanlreichen individuellen Genptrofilen, 
Derterminierung von allelischen Kategorien iiber simularity analyse. 

d) Identifizierung einer allelischen Kategorie in US-Amerikanern afrikanischer Abstammung, 
die mit der genetischen Disposition zu DrogenmiBbrauch assoziiert ist. 
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Patentanspruche: 

1. Methode zur Identifizierung, Darstellung und Auswertung sowie Interpretation 
interindividueller DNA Sequenzunterschiede, dadurch gekennzeichnet, dafl man 

- die genomische DNA der zu untersuchenden Individuen isoliert, 

- Segmente der zu vergleichenden Gene, genomischen Regionen, Genome definiert, 

- diese Segmente mittels PCR unter Verwendung hochspezifischer Oligonukleotide gezielt 
isoliert und in einer ausreichenden Anzahl von Kopien herstellt, 

- eine simultane Sequenzierung aller gewonnenen Gensegmente, die nun als PCR-Produkte 
vorliegen, durchfuhrt, 

- das dadurch entstehende Gemisch von Terminationsreaktionen, das die individuellen 
Sequenzen aller Gensegmente enthalt, anschlieBend auf einem Sequenziergel 
elektrophoretisch trennt und 

- mittels direkter Transferelektrophorese auf eine Membran iibertragt, 

- anschlieBend durch Hybridisierung der Membran mit einem markierten, hochspezifischen 
Oligonukleotid die individuellen Sequenzen eines bestimmten Gensegmentes aus dem 
urspriinglicben Gemisch sichtbar macht, 

- diesen Vorgang sooft wiederholt, bis alle Gensegmente aus dem urspriinglichen Pool 
detektiert sind 

- und anschlieBend durch Image-Analyse interindividuelle DNA-Sequenzunterschiede 
detektiert, und durch mathematische Aufarbeitung ein Genprofilmuster erstellt und 
auswertet. 

2. Methode nach Anspruch 1, dadurch gekennzeichnet, daB sie auf alle Nukleinsauren 
angewendet wird. 

3. Methode nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB multiple Gensegmente eines 
bestimmten Individuums simultan sequenziert werden, oder ein und dasselbe Segment simultan 
in multiplen Individuen sequenziert werden. 

4. Methode nach Anspruch 1 bis 3, dadurch gekennzeichnet, daB die simultane Sequenzierung 
mit multiplen, hochspezifischen Sequenzierprimern durchgefuhrt wird, wobei die Anzahl der 
Sequenzierprimer der Anzahl der Gensegmente entspricht. 

5. Methode nach Anspruch 1-3, dadurch gekennzeichnet, daB die simultane Sequenzierung mit 
multiplen, hochspezifischen Sequenzierprimern durchgefuhrt wird, wobei die Anzahl der 
Sequenzierprimer der Anzahl der virtuellen Gensegmente entspricht. 
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6. Methode nach Anspruch 5, dadurch gekennzeichnet, daB virtuelle Gensegmente dadurch 
gekennzeichnet sind, daB sie Bestandteil eines mehrere Gensegmente umfassenden PCR- 
Fragmentes sind. 

7. Methode nach einem der Anspruche 1 bis 6, dadurch gekennzeichnet, daB sie fur 20 - 30, 
bevorzugt 24, Individuen, durchgefuhrt wird, so daB eine Membran die Sequenzen aller 
Gensegmente der untersuchten Individuen enthalt. 

8. Methode nach einem Anspriichen 1 bis 6, dadurch gekennzeichnet, dafi deine Membran 
nicht nur die Sequenzen aller Gensegmente einzelner Individuen enthalt, namlich 20-30, 
bevorzugt 24, Individuen enthalt, sondern alternativ auch die Sequenzen eines Gensegmentes 
in multiplen Individuen enthalt. 

9. Methode nach Anspruch 8, dadurch gekennzeichnet, daB sie 2-100 x 20-30, bevorzugt 24, 
enthalt. 

10. Methode nach einem der Anspriiche 1 bis 9, dadurch gekennzeichnet, daB spezifisch fur 
den Nukleinsauresequenzvergleich die basenspezifischen Terminationsreaktionen von jeweils 
12 Individuen nebeneinander angeordnet werden, so daB auf der Membran und schliefilich auf 
dem Image jeweils Blocke von je 12 individuellen G-Reaktionen, und analog T-, A-, und C- 
Reaktionen sichtbar werden. 

11. Methode nach Anspruch 10, dadurch gekennzeichnet, daB die Sequenzunterschiede 
unmittelbar dargestellt werden. 

12. Methode nach einem der Anspruche 1 bis 11, dadurch gekennzeichnet, daB die 
hochspezifischen Oligonukleotide radioaktiv oder mittels anderer Verfahren markiert sind. 

13. Methode nach Anspruch 12, dadurch gekennzeichnet, daB die Sichtbarmachung definierter 
DNA-Sequenzen aus dem Reaktionsgemisch dadurch erfolgt, daB die hochspezifischen 
Oligonukleotide mit einer DNA-Sequenz hybridisiert, die integraler Bestandteil eines 
definierten genomischen Zielsegmentes ist, und die sich an die 
Sequenzierprimerhybridisierungsregion anschlieBt. 

14. Methode nach Anspruch 12, dadurch gekennzeichnet, dafi die Sichtbarmachung definierter 
DNA-Sequenzen aus dem Reaktionsgemisch dadurch erfolgt, daB die hochspezifischen 
Oligonukleotide mit einer DNA-Sequenz hybridisiert, die extern synthetisiert wurde und 
intergraler Bestandteil des PCR- oder Sequenzierprimers ist. 
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15. Methode nach einem der Anspriiche 1 bis 14, dadurch gekennzeichnet, daB 
Genprofilmuster, die eine genetische Differenzierung fur das Erkennungsrisiko bzw. fur die 
Auspragung phanotypischer Merkmale jeder Art in jeder Species zulasseo, durch Reduktion 
der Anzahl von Geno- bzw. Haplotypen mittels Klassifizierungsverfahren unter Ausnutzung 
des Haufigkeitsvergleichs von Geno- bzw. Haplotypen zweier verschiedener phanotypischer 
Gruppen einer Spezies erstellt warden. 

16. Verwendung eines definierten Sets von Oligonukleotiden fiir diagnostische Zwecke, wobei 
die Oligonukleotide mit gesamtgenomischer DNA und DNA-Zielfragmenten hybridisieren, um 
damit zugleich die gezielte und simultane Generierung multipler individueller Sequenzen durch 
Amplification, Sequenzierung und Dekodierung eines Pools von genomischen Sequenzen 
durchzufuhren 

17. Verwendung der Methode gemaB der Anspriiche 1 bis 15 zur Identifizierung 
interindividueller DNA Sequenzunterschiede in Kandidatengenen, Genomen oder jeder 
genomischen Zielregion, die Erkrankungen ursachlich zugrundeliegen, genetisches Risiko fur 
eine Erkrankung tragen, oder mit interindividuell unterschiedlicher Ansprechbarkeit auf 
Medikamente, suchterzeugende Substanzen, oder endogene Liganden einhergehen. 

18. Verwendung nach Anspruch 17, dadurch gekennzeichnet, daB Pflanzengenome, bakterielle 
Genome, grundsatzlich Genome aller Spezies, so daB in den Bereichen Molekularbiologie, 
Medizin, Biologie, Verterinarmedizin, Agrarwissenschaften und Okobiologie Aufschlusse iiber 
die Entstehung unterschiedlicher Merkmale auf der Basis genetischer Variationen gewonnen 
werden konnen. 

19. Verwendung der Methode gemaB Anspriiche 1 bis 15 zur Image-Generierung und Image- 
Analyse, die auf der Basis eines spezifischen Auftragsschemas der individuellen 
Terminationsreaktionen die unmittelbare Detektion von DNA Sequenzunterschieden, SNPs 
(single nucleotide polymorphisms), und Indel-Polymorphismen. und der 
Images/Datenverwaltung indem Bandenmuster einer gegebenen Base eines definierten DNA- 
Segmentes als spezifisches Identifizierungsmuster fur jedes Nukleinsaure-Segment dienen. 

20. Verwendung der Methode gemaB Anspriiche 1 bis 15 um DNA-Sequenzen multipler 
Individuen simultan in einem GefaB und in einem Vorgang durchzufuhren. 
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